ارائه خصیصه های خاص زبان فارسی جهت بازیابی و بازشناسی کلمات تصویری فارسی با استفاده از تعبیه برچسب

نویسندگان

مجید ایرانپور مبارکه

دانشجوی دکتری، دانشکده مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه صتعتی شاهرود علیرضا احمدی فرد

دانشکده مهندسی برق و رباتیک، دانشگاه صنعتی شاهرود

چکیده

جستجو و بازیابی کلمات دستنویس در اسناد تصویری روشی جایگزین برای بازشناسی کاراکترهای نوری (ocr) است. این راهکار بیشتر در مواردی که بازشناسی کاراکترهای نوری دقت پایینی دارند، مانند متون دستنویس یا متون چاپی با کیفیت پایینی مطرح می گردد. امروزه یکی از روشهای کارآمد در بازیابی مبتنی بر محتوای تصویر، که برای کلمات تصویری هم توسعه داده شده است، استفاده از رده بندی مبتنی بر خصیصه (attribute-based classification) و همچنین تعبیه برچسب (label embedding) است. در این مقاله چند خصیصه مختلف مبتنی بر ساختار نگارش زبان فارسی جهت استفاده در بازیابی کلمات تصویری فارسی معرفی شده و نتایج حاصل از روش های مبتنی بر خصیصه های پیشنهادی مقایسه گردیده است. در ارائه خصیصه ها ساختار نگارشی زبان فارسی درنظر گرفته شده است تا بهترین مطابقت را با روش نگارش فارسی داشته باشد. روش مورد مطالعه توانایی بازیابی کلمات تصویری با استفاده از کلمه پرسشی تصویری و متنی را داراست. علاوه بر این می تواند به عنوان روشی جهت بازشناسی کلمات نیز مورد استفاده قرار گیرد. همچنین روش ارائه شده با استفاده از قابلیت رده بندی مبتنی بر خصیصه، توانایی شناسایی کلاس کلماتی که در پایگاه داده آموزشی وجود ندارد را نیز دارا است. آزمایش های تجربی بر روی دو مجموعه داده استاندارد فارسا و ایرانشهر مورد بررسی قرار گرفته و نتایج حاصل از اجرای روش پیشنهادی قابل قبول است.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

مدل‌سازی بازشناسی واجی کلمات فارسی

Abstract of spoken word recognition is proposed. This model is particularly concerned with extraction of cues from the signal leading to a specification of a word in terms of bundles of distinctive features, which are assumed to be the building blocks of words. In the model proposed, auditory input is chunked into a set of successive time slices. It is assumed that the derivation of the underly...

متن کامل

ساخت موضوعی کلمات مشتق در زبان فارسی

ساخت موضوعـی بـه فهرست موضوع‌هـای یک محمـول اطلاق می‌شود. مثلاً، فعل «خورد» دو موضوع و فعل «داد» سه موضوع در ساخت موضوعی خود دارد. معمولاً ساخت موضوعی افعال پس از افزوده‌شدن یک وند اشتقاقی به آنها تغییر می‌کند، به‌گونه‌ای که ساخت موضوعی مشتق حاصله با ساخت موضوعی کلمۀ پایه متفاوت است. در مقالة حاضر، ساخت موضوعی مشتقات فعلی زبان فارسی و تأثیر وند افزایی بر ساخت موضوعی کلمة پایه را مطالعه می‌کنیم. چ...

متن کامل

بررسی مقابله‌ای کلمات اندازه گیری زبان فارسی با زبان کردی (گویش سورانی و کردی کلهری) با رویکرد آموزش زبان فارسی به غیر فارسی زبانان

اهمیت و جایگاه زبان­شناسی مقابله‌ای در بررسی تفاوت‌ها و شباهت‌ها میان دو یا بیشتر از دو زبان، به­ویژه مقایسۀ زبان فارسی با زبان­های دیگر،  نیازمند برنامه­ریزی و انجام تحقیقات بیشتری است. امروزه، در این زمینه، کارهای زیادی در حوزه­های مختلفِ:  دستور، آواشناسی، گفتمان، واژگان و حتی بررسی مقابله­ای دو متن از دو زبان، به انجام رسیده­است. درپژوهش حاضر که در زمینۀ واژگان است سعی شده اسم­های اندازه­گیر...

متن کامل

سیستم برچسب گذاری اجزای واژگانی کلام در زبان فارسی

Abstract: Part-Of-Speech (POS) tagging is essential work for many models and methods in other areas in natural language processing such as machine translation, spell checker, text-to-speech, automatic speech recognition, etc. So far, high accurate POS taggers have been created in many languages. In this paper, we focus on POS tagging in the Persian language. Because of problems in Persian POS t...

متن کامل

بازشناسی علامت‌های ساکن زبان اشاره‌ی فارسی با استفاده از یک توصیف‌گر شکلی جدید

در این مقاله یک سیستم برای بازشناسی علامت‌های ساکن زبان اشاره‌ی فارسی پیشنهاد شده است. این سیستم بر مبنای یک ویژگی شکلی جدید طراحی شده و قادر است با نرخ تشخیص بالایی، علامت‌های ساکن الفبای زبان اشاره‌ی فارسی را به طور خودکار بازشناسی کند. در اینسیستم، ابتدا با استفاده از آنالیز مؤلفه‌ی اصلی (PCA)، جهت‌های غالب دست را بدست می‌آوریم و تصاویر را در جهت غالب دست، به نحوی که سیستم مختصات جدید تصویر ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید


عنوان ژورنال:
ماشین بینایی و پردازش تصویر

جلد ۳، شماره ۱، صفحات ۴۵-۵۴

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023